home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000018_timbl _Thu Nov 28 08:57:45 1991.msg < prev    next >
Internet Message Format  |  1992-11-30  |  6KB

  1. Return-Path: <timbl>
  2. Received: by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA16501; Thu, 28 Nov 91 08:57:45 GMT+0100
  4. Date: Thu, 28 Nov 91 08:57:45 GMT+0100
  5. From: timbl (Tim Berners-Lee)
  6. Message-Id: <9111280757.AA16501@ nxoc01.cern.ch >
  7. Received: by NeXT Mailer (1.62)
  8. To: www-talk
  9. Subject: Document identifiers
  10.  
  11.  
  12.  
  13. [from clifford lynch via brewster kahle]
  14.  
  15. The Coalition for Networked Information
  16. Architectures & Standards Working Group
  17.  
  18. Workshop on ID and Reference Structures
  19. for Networked Information
  20.  
  21. There is an increasingly urgent need to develop working
  22. standards for referencing networked information objects.
  23. This has a wide range of applications, including links from
  24. MARC records to source material, references from courseware
  25. to published material in electronic form, networked
  26. hypertext pointers, and digital document IDs of the sort
  27. used in the Wide Area Information Server (WAIS) system.
  28. Many projects underway today need these types of
  29. identifiers, and a number of efforts have developed ad-hoc
  30. solutions so that they can progress. Unfortunately, the
  31. proliferation of these ad-hoc solutions is a major barrier
  32. to interoperability.
  33.  
  34. Responding to this need, the Coalition for Networked
  35. Information's Architectures and Standards Working Group is
  36. initiating an effort to develop such a working standard, or
  37. agreement. One outcome of this work may be a draft
  38. specification that is forwarded to standards-making bodies
  39. such as the National Information Standards Organization for
  40. consideration as the basis of an actual standard. In
  41. addition, the resulting specification may be submitted to
  42. the Internet Engineering Task Force for consideration as a
  43. draft Request for Comment (RFC).
  44.  
  45. I propose the following process to reach agreement. I am
  46. distributing this announcement, which includes a number of
  47. assumptions towards such a specification; redistribution is
  48. encouraged. Discussion can be carried out electronically on
  49. the new LISTSERV mailing list that has been set up for the
  50. Architectures and Standards Working Group, which you can
  51. subscribe to by sending a mail message in the form
  52.  
  53. SUB CNI-ARCH yourname
  54.  
  55. to
  56.  
  57. LISTSERV@UCCVMA.BITNET
  58.  
  59. Barring the unlikely event that rapid and full agreement on
  60. the specification is reached through electronic discussion,
  61. CNI will sponsor a one-day invitational meeting in early
  62. November (date and place to be determined). If you have a
  63. strong interest in this topic and feel you should attend the
  64. meeting, contact me either by electronic mail
  65. (CALUR@UCCMVSA.BITNET or CALUR@UCCMVSA.UCOP.EDU) or by
  66. telephone (510) 987-0522 to have your name added to the
  67. invitation list.
  68.  
  69. Aspects of the problem that need to be addressed include
  70. those below, which I have listed along with some assumptions
  71. (all subject to question) to provide a starting point for
  72. our discussions. I do not claim that this list is complete;
  73. look for areas overlooked as well as react to those
  74. mentioned. Many people have contributed ideas that appear in
  75. the list below, but I must make special note of the
  76. contributions of Brewster Kahle of Thinking Machines and his
  77. excellent document "Document Identifiers, or International
  78. Standard Book Numbers for the Electronic Age" (5/9/90).
  79.  
  80. 1. The need for identifiers, as distinct from location
  81. information. This is best handled by a number (much like an
  82. ISSN or ISBN), but the system must accomodate multiple
  83. number-assigning agencies. Thus, the identifier is proposed
  84. as <numbering-authority>,<identifier> where numbering
  85. authorities are registered.
  86.  
  87. 2. The pointers must be representable as an ASCII string to
  88. facilitate inclusion in a wide range of material, including
  89. documents and electronic mail.
  90.  
  91. 3. Location information must support multiple Locations for
  92. the document, including the "location of record" and one or
  93. more redistribution centers, local caches, etc. The means of
  94. specifying a location should be sufficiently general to span
  95. at least the set of networks covered under the Internet
  96. Domain Naming system (DNS).
  97.  
  98. 4. Objects may be retrieved by a variety of access
  99. mechanisms from servers, including FTP, LISTSERV, Z39.50,
  100. and perhaps FTAM and SQL-based database access, as well as
  101. requests for paper copies. The location information should
  102. be sufficiently general to include information about these
  103. different types of access techniques, and extensible to
  104. include new access methods that may develop in future.
  105.  
  106. 5. Perhaps the location identifier should include some
  107. information about the format and size of the object; on the
  108. other hand, perhaps it should not. Discussion?
  109.  
  110. 6. It should be possible to further qualify a reference to a
  111. "sublocation" within an object (which would have meaning
  112. only to the server that houses it). This is needed, for
  113. example, for hypertext-type links.  Such a sublocation might
  114. be the 25th paragraph of a text, for a hypertext-type
  115. pointer.
  116.  
  117. 7. Indirection should be supported. In other words, one
  118. should be able to format the location as the name of a
  119. server that can be passed the identifier and which would
  120. return location information. The protocol mechanism(s) for
  121. doing this need to be specified as well.
  122.  
  123. 8. While full rights and permissions data would seem to be
  124. outside the scope of such a pointer, it might be useful to
  125. include at least some basic information. This might be an
  126. indication that the object is not copyrighted and can be
  127. freely distributed, that it is copyrighted but can be freely
  128. distributed, that it can be redistributed for noncommercial
  129. use, or that restrictions apply to redistribution. Also, it
  130. might make sense to include a pointer of some sort (an
  131. e-mail address? a host address?) for further information
  132. about rights.
  133.  
  134. 9. Perhaps there might be some type of checksum that can be
  135. calculated on the retrieved object to ensure that the
  136. pointer and the object have not gotten out of synch?
  137.  
  138.